tensorflow 中 tf.strided_slice 函数理解

我们在工程中可能会利用 tensorflow 中的 strided_slice 函数来对向量进行切片,特别是常用于对多维向量的切片,但是官方说明比较晦涩,但是搞不清楚的话,在使用的时候,就不知道如何确定参数,所以在此先把这个函数搞清楚。它的函数原型如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
tf.strided_slice(
input_,
begin,
end,
strides=None,
begin_mask=0,
end_mask=0,
ellipsis_mask=0,
new_axis_mask=0,
shrink_axis_mask=0,
var=None,
name=None
)

它的四个最主要的参数说明如下:

  • input_:要进行切片处理的输入数据
  • begin:开始进行切片的索引,输入为一个 list,分别对应各个维度的开始切片的索引
  • end:终止切片的索引(开区间),输入为一个 list(长度与begin一样),分别对应各个维度的终止切片的索引
  • strides:各个维度进行切片的步长(长度通常与begin和end一致,毕竟对于每个我们要切片的维度,我们都要负责的指定出开始,结尾和步长嘛)

官方的一个例子为:

1
2
3
4
5
6
input = tf.constant([[[1, 1, 1], [2, 2, 2]],
[[3, 3, 3], [4, 4, 4]],
[[5, 5, 5], [6, 6, 6]]])
out = tf.strided_slice(input, [1, 0, 0], [2, 2, 2], [1, 1, 1])
sess = tf.InteractiveSession()
out.eval()

输出为 [[[3, 3], [4, 4]]]

对这个例子,来进行展开理解,首先,input 数据是一个三维数据,下面这样看应该能清楚一点,从外向内看,分别对应第一维、第二维和第三维:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
[
[
[1, 1, 1],
[2, 2, 2]
],
[
[3, 3, 3],
[4, 4, 4]
],
[
[5, 5, 5],
[6, 6, 6]
]
]

我们的 tf.strided_slice 中的 begin 参数为 (1, 0, 0)end 参数为 (2, 2, 2)stride 参数为 (1, 1, 1),即我们要对三个维度都进行切分,我们来逐步来对三个维度进行切分。

  1. 对第一维进行切分,索引从 1 到 2,步长为 1,即我们只取第一个维度的索引为 1 的部分,即取三个二维数组中的第二个,即当前的输出为:

    1
    2
    3
    4
    5
    6
    7
    out1 = 
    [
    [
    [3, 3, 3],
    [4, 4, 4]
    ]
    ]
  2. 对第二维进行切分(在第一维切分得到的结果上进行),索引从 0 到 2,步长 为 1,即我们取第二个维度的索引为 0 和 1 的部分,即对二维数组中的两行都取,即当前的输出为:

    1
    2
    3
    4
    5
    6
    7
    out2 = 
    [
    [
    [3, 3, 3],
    [4, 4, 4]
    ]
    ]
  3. 对第三维进行切分(在第二维切分得到的结果上进行),索引从 0 到 2,步长 为 1,即我们取第三个维度的索引为 0 和 1 的部分,即对二维数组中的三列取前两列,即当前的输出为:

    1
    2
    3
    4
    5
    6
    7
    out3 = 
    [
    [
    [3, 3],
    [4, 4]
    ]
    ]

这就是我们最后的输出。